Bloom Filter

Bloom Filter 是一种非常高效的概率型数据结构，主要用于判断一个元素是否可能存在于一个集合中。

它有两个核心特点：

快速查询：查询速度非常快，因为它不需要存储实际的元素，而是通过一系列哈希函数进行位运算。
可能存在误判：它会告诉我们一个元素“绝对不存在”或“可能存在”。如果它说一个元素“可能存在”，那么这个元素可能真的存在，也可能不存在（这就是所谓的假阳性，False Positive）。但是，如果它说一个元素“绝对不存在”，那么这个元素就一定不存在。

Bloom Filter 的核心是一个由若干位（bits）组成的数组，初始时所有位都设置为 0。

当你向过滤器中添加一个元素时，会发生以下步骤：

当你查询一个元素时，会发生以下步骤：

由于其“可能存在假阳性”的特性，Bloom Filter 适合用于那些可以容忍少量错误，但对空间和查询速度要求极高的场景，例如：

总结： Bloom Filter 的优势在于其极高的空间和时间效率，而其代价是无法保证 100% 的准确性。它是一个完美的“快速否定”工具，可以帮助我们快速排除那些不存在的元素，从而提高系统的整体性能。